صدای دستیاران صوتی مانند سیری (Siri) اپل و الکسا (Alexa) آمازون بسیار مصنوعی هستند و فقط برای همین استفاده جهت گفتن وضعیت آب و هوا و دیگر اتفاقات کارایی دارند وگرنه کسی به نظر نمیرسد دوست داشته باشد آنها را جهت خواندن کتب صوتی به کار گیرد.
به گزارش
سافت گذر، یک شرکت استارتاپی از لندن به نام DeepZen، با استفاده از الگوریتمهای هوش مصنوعی توانسته ابزار تبدیل متن به گفتاری تولید کند که نه تنها یک انسان داستان را میخواند بلکه در مواقع ضروری، تن صدا را نیز برای القای احساسات تغییر میدهد. با این شیوه، کمپانی نامبرده مدعی است که هزینه تولید کتاب صوتی تا 90 درصد کاهش مییابد.
تایلان کامیس، مدیرعامل و هم بنیانگذار DeepZen میگوید:«« سیستم ما به معنای واقعی کلمه انقلابی در کتابهای صوتی ایجاد میکند. در آن از یادگیری عمیق و شبکههای نورونی بهره بردهایم تا ببینیم یک انسان چگونه صحبت میکند. سپس به سیستم اینگونه آموزش میدهیم که در مواقع ضروری نحوه خواندن متن را تغییر دهد تا احساسات به کاربر القا شود. نتیجه چنین کاری، تولید یک صدای بسیار نزدیک به صوت انسانهاست»».
مطمئناً چنین سیستمی میتواند نشاندهنده پیشرفت
هوش مصنوعی و آینده خطرناک شغلهای انسانها باشد. در چنین حالتی، به نظر میرسد قصهگویان کسانی خواهند بود که با ابداع DeepZen، شغل خود را از دست خواهند داد. اگر اینگونه فکر کنیم که این سیستم تأثیری بر آینده انسانها ندارد، بسیار مبتدیانه خواهد بود ولی همانطور که کامیس اعلام کرده، ابزار تولید شده میتواند در خدمت بشریت باشد.
برای مثال، چنین سیستمهایی به درد کسانی میخورد که مشکل خواندن دارند و برای ناشرانی مفید خواهد بود که هزینه آنچنانی بابت تولید کتاب صوتی ندارند.
تایلان کامیس ادامه میدهد:«« ما در پی آن هستیم تا برای صنعت گیمینگ، فیلمسازی و . . . ، از صداهای طبیعی و شیوههای تبدیل متن به گفتار همزمان استفاده کنیم تا تجربه انجام دادن این کارها برای کاربران افزایش یابد»».
منبع: digitaltrends.com